70个NumPy分级练习题:用Python一举搞定机器学习矩阵运算
翻译 | 王柯凝
编辑 | suisui
【导读】Numpy是一个开源的Python科学计算库,专用于存储和处理大型矩阵,相比Python自身的嵌套列表结构要高效很多,是数据分析、统计机器学习的必备工具。Numpy还是深度学习工具Keras、sk-learn的基础组件之一。
此处的70个numpy练习,可以作为你学习numpy基础之后的应用参考。练习难度分为4层:从1到4依次增大。
快来试试你对矩阵运算掌握到了什么程度:
1.导入模块numpy并以np作为别名,查看其版本
难度:1
问题:导入模块numpy并以np作为别名,打印版本号
答案:
你必须将模块numpy导入,以np命名,练习中的其他代码才能正常运行。
安装numpy,建议使用anaconda提供的安装方案。
anaconda链接:
https://www.anaconda.com/download/
2.如何创建一个一维数组?
难度:1
问题:创建一个含有从0到9数字的一维数组,并输出
答案:
3.如何创建布尔数组?
难度:1
问题:创建一个3×3的所有值为True的numpy数组。
答案:
4.如何从1维数组中提取满足给定条件的元素?
难度:1
问题:从arr数组中提取所有奇数元素。
输入:
输出:
答案:
5.在numpy数组中,如何用另一个值替换满足条件的元素?
难度:1
问题:用-1替换arr数组中所有的奇数。
输入:
输出:
答案:
6.如何替换满足条件的元素而不影响原始数组?
难度:2
问题:将arr数组中的所有奇数替换为-1而不更改arr数组
输入:
输出:
答案:
7.如何重塑数组?
难度:1
问题:将1维数组转换为2行的2维数组
输入:
输出:
答案:
8.如何垂直堆叠两个数组?
难度:2
问题:垂直堆叠数组a和b。
输入:
输出:
答案:
9.如何水平堆叠两个数组?
难度:2
问题:水平堆叠数组a和b。
输入:
输出:
答案:
10.没有硬编码的情况下,在numpy中如何生成自定义序列?
难度:2
问题:创建以下模式而不使用硬编码。只能使用numpy函数和输入数组a。
输入:
输出:
答案:
11.如何获得两个python numpy数组之间的共同元素?
难度:2
问题:获取数组a和b之间的共同元素。
输入:
输出:
答案:
12.从一个数组中删除存在于另一个数组中的元素?
难度:2
问题:从数组a中删除在数组b中存在的所有元素。
输入:
输出:
答案:
13.获取两个数组元素匹配的索引号。
难度:2
问题:获取数组a和b的元素匹配的索引号
输入:
输出:
答案:
14.从numpy数组中提取给定范围内的所有数字?
难度:2
问题:从数组a提取5到10之间的所有元素。
输入:
输出:
答案:
15.如何将处理标量的python函数在numpy数组上运行?
难度:2
问题:将处理两个标量函数maxx在两个数组上运行。
输入:
输出:
答案:
16.如何交换2维numpy数组中的两个列?
难度:2
问题:交换数组arr中的第1列和第2列。
答案:
17.如何交换2维numpy数组中的两个行?
难度:2
问题:在数组arr中交换第1行和第2行。
答案:
18.如何反转2维数组的行?
难度:2
问题:反转二维数组arr的行。
答案:
19.如何反转二维数组的列?
难度:2
问题:颠倒二维数组arr的列。
答案:
20.如何创建一个包含5到10之间随机浮点数的二维数组?
难度:2
问题:创建一个5×3的二维数组,以包含5到10之间的随机浮点数。
答案:
21.打印python numpy数组并保留3位小数?
难度:1
问题:打印或显示numpy数组rand_arr,并三位小数。
输入:
答案:
22.如何使用科学记数法(如1e10)漂亮地打印一个numpy数组?
难度:1
问题:使用科学记数法(如1e10)漂亮的打印数组rand_arr
输入:
输出:
答案:
23.如何限制numpy数组输出中打印元素的数量?
难度:1
问题:将python numpy数组a中打印的元素数量限制为最多6个。
输入:
输出:
答案:
24.如何在不截断的情况下打印完整的numpy数组?
难度:1
问题:打印完整的numpy数组a,且不截断。
输入:
输出:
答案:
25.如何在python numpy中导入含有数字和文本的数据集,并保持的文本完整性?
难度:2
问题:导入iris数据集并保持文本不变。
答案:
由于我们想保留物种,一个文本字段,我已经把dtype设置为object。设置dtype = None,则会返回一维元组数组。
26.如何从一维元组数组中提取特定的列?
难度:2
问题:从上一个问题中导入的一维iris数组中提取species文本列。
输入:
答案:
27.如何将一维元组数组转换为二维numpy数组?
难度:2
问题:通过省略species文本字段将一维iris数组转换为二维数组iris_2d。
输入:
答案:
28.如何计算numpy数组的平均值,中位数,标准差?
难度:1
问题:找出 iris的 sepallength平均值,中位数,标准差(第1列)
答案:
29.如何标准化一个数组至0到1之间?
难度:2
问题:创建一个规范化形式的iris的sepallength,其值的范围在0和1之间,最小值为0,最大值为1。
输入:
答案:
30.如何计算softmax值?
难度:3
问题:计算sepallength的softmax分数。
答案:
31.如何找到一个numpy数组的百分位的值?
难度:1
问题:找到iris的sepallength第5位和第95百分位的值。
答案:
32.如何在数组中的随机位置插入一个值?
难度:2
问题:在iris_2d数据集的20个随机位插入np.nan值
答案:
33.如何找到numpy数组中缺失值的位置?
难度:2
问题:在iris_2d的sepallength(第1列)中查找缺失值的数量和位置。
答案:
34.如何根据两个或多个条件过滤一个numpy数组?
难度:3
问题:过滤具有petallength(第3列)> 1.5和sepallength(第1列)<5.0的iris_2d的行。
答案:
35.如何从numpy数组中删除包含缺失值的行?
难度:3:
问题:选择没有nan值的iris_2d数组的行。
答案:
36.如何找到numpy数组的两列之间的相关性?
难度:2
问题:在iris_2d数组中查找SepalLength(第1列)和PetalLength(第3列)之间的关系。
答案:
37.如何查找给定数组是否有空值?
难度:2
问题:找出数组iris_2d是否有缺失的值。
答案:
38.如何在numpy数组中使用0替换所有缺失值?
难度:2
问题:在numpy数组中用0替换nan。
答案:
39.如何查找numpy数组中的唯一值的数量?
难度:2
问题:找出iris的species中的唯一值及其数量。
答案:
40.如何将数值转换为分类(文本)数组?
难度:2
问题:将iris_2d的花瓣长度(第3列)组成一个文本数组,如果花瓣长度为:
<3则为'小'
3-5则为'中'
'> = 5则为'大'
答案:
41.如何利用numpy数组现有列创建一个新的列?
难度:2
问题:在iris_2d中为volume创建一个新列,其中volume是(pi x petallength x sepal_length ^ 2)/ 3。
答案:
42.如何在numpy中进行概率抽样?
难度:3
问题:随机抽样iris的species,使setose是versicolor和virginica的数量的两倍。
答案:
方法2是首选,因为它创建了一个可用于采样二维表格数据的索引变量。
43.用另一个数组分组时,如何获得数组中第二大的元素值?
难度:2
问题:第二长的物种的最大价值是什么?
答案:
44.如何按列排序二维数组?
难度:2
问题:根据sepallength列对iris数据集进行排序。
答案:
45.如何在numpy数组中找到最频繁出现的值?
难度:1
问题:找到iris数据集中最常见的花瓣长度值(第3列)。
输入:
答案:
46.如何找到首次出现的值大于给定值的位置?
难度:2
问题:查找在iris数据集的第4列花瓣宽度中第一次出现值大于1.0的位置。
答案:
47.如何将所有大于给定值的值替换为给定的cutoff值?
难度:2
问题:从数组a中,替换大于30包括30且小于10到10的所有值。
输入:
答案:
48.如何从numpy数组中获取n个值的位置?
难度:2
问题:获取给定数组a中前5个最大值的位置。
答案:
49.如何计算数组中所有可能值的行数?
难度:4
问题:计算有唯一值的行数。
输入:
输出:
输出包含10列,表示1到10之间的数字。这些值是相应行中数字数量。
例如,单元(0,2)的值为2,这意味着数字3在第一行中恰好出现2次。
答案:
50.如何将多维数组转换为一维数组?
难度:2
问题:将array_of_arrays转换为平坦的线性一维数组。
输入:
输出:
答案:
51.如何为numpy中的数组生成独热编码(one-hot encodings)?
难度:4
问题:计算独热编码。
输入:
输出:
答案:
52.如何创建按分类变量分组的行号?
难度:3
问题:创建由分类变量分组的行号。使用iris的species中的样品作为输入。
输入:
输出:
答案:
53.如何根据给定的分类变量创建分组ID?
难度:4
问题:根据给定的分类变量创建组ID。使用以下iris的species中样品作为输入。
输入:
输出:
答案:
54.如何使用numpy排列数组中的元素?
难度:2
问题:为给定的数字数组a排序。
输入:
输出:
答案:
55.如何使用numpy对多维数组中的元素进行排序?
难度:3
问题:创建一个与给定数字数组a相同形式的排列数组。
输入:
输出:
答案:
56.如何找到numpy二维数组每一行中的最大值?
难度:2
问题:计算给定数组中每一行的最大值。
答案:
57.如何计算numpy二维数组每行中的最小值?
难度:3
问题:针对给定的二维numpy数组计算每行的min-max。
答案:
58.如何在numpy数组中找到重复的记录?
难度:3
问题:在给定的numpy数组中找到重复的条目(从第2个起),并将它们标记为True。第一次出现应该是False。
输出:
答案:
59.如何找到numpy中的分组平均值?
难度:3
问题:查找由二维numpy数组中的分类列分组的数值列的平均值
输入:
输出:
答案:
60.如何将PIL图像转换为numpy数组?
难度:3
问题:从以下URL中导入图像并将其转换为numpy数组。
URL='https://upload.wikimedia.org/wikipedia/commons/8/8b/Denali_Mt_McKinley.jpg'
答案:
61.如何删除numpy数组中所有缺失的值?
难度:2
问题:从一维numpy数组中删除所有nan值
输入:
输出:
答案:
62.如何计算两个数组之间的欧氏距离?
难度:3
问题:计算两个数组a和b之间的欧式距离。
输入:
答案:
63.如何在一维数组中找到所有局部最大值(或峰值)?
难度:4
问题:在一维numpy数组a中查找所有峰值。峰值是两侧较小值包围的点。
输入:
输出:
其中,2和5是峰值7和6的位置。
答案:
64.如何从二维数组中减去一维数组,其中一维数组的每个元素都从相应的行中减去?
难度:2
问题:从二维数组a_2d中减去一维数组b_1d,使得每个b_1d项从a_2d的相应行中减去。
输出:
答案:
65.如何找到数组中第n个重复项的索引
难度:2
问题:找出x中第1个重复5次的索引。
答案:
66.如何将numpy的datetime64对象转换为datetime的datetime对象?
难度:2
问题:将numpy的datetime64对象转换为datetime的datetime对象。
答案:
67.如何计算numpy数组的移动平均值?
难度:3
问题:计算给定一维数组窗口大小为3的移动平均值。
输入:
答案:
68.如何只给出起点,长度和步长来创建一个numpy数组序列?
难度:2
问题:创建一个长度为10的numpy数组,从5开始,在连续数字之间有一个3的步长。
答案:
69.如何填写不规则的numpy日期系列中的缺失日期?
难度:3
问题:给定一个不连续的日期数组。通过填补缺失的日期,使其成为连续的日期序列。
输入:
答案:
70.如何在给定一个一维数组中创建步长?
难度:4
问题:从给定的一维数组arr,使用步长生成一个二维数组,窗口长度为4,步长为2,如[[0,1,2,3],[2,3,4,5],[4,5,6,7]..]
输入:
输出:
答案:
原文地址:
https://www.machinelearningplus.com/101-numpy-exercises-python/
福利
扫码添加小助手,回复:1,加入Python技术交流群,共享Python学习资料,定时更新。
推荐阅读:
❤Python大本营“号内搜”功能全新升级
搜索功能更强大,请在公众号菜单栏体验